iT邦幫忙

2023 iThome 鐵人賽

DAY 20
0
AI & Data

打造數據科學之路:資料分析與機器學習的完整指南系列 第 20

鐵人賽第二十天~隨機森林介紹

  • 分享至 

  • xImage
  •  

~今天要分享的是「隨機森林介紹」~

隨機森林是一種監督式機器學習方式,可用於解決迴歸跟分類的問題。
隨機森林可以說是決策樹的延伸,因為它是由多個決策樹建立而成的,隨機森林比起決策樹具有更好的預測準確性跟泛化能力,因為隨機森林使用的是隨機採樣,這有助於減少模型過擬合,另外,它還具有可以處理高維度資料且不用事先做特徵工程(特徵挑選)的優點。

[考試愛考觀念]
隨機森林的預測結果是採投票(分類問題)或平均(回歸問題)的方式來決定,以分類男生和女生的問題為例,隨機森林的每棵樹可能分別在判斷頭髮的長短、有沒有鬍子、有沒有喉結等特徵(重點:每顆樹之間是沒有關聯的!),之後再依據每棵樹判斷的結果來預測最終結果為何,假設有3棵樹認為是女生,2顆樹認為是男生,由於大多數樹的預測結果是女生,那麼最後隨機森林的預測結果就會是女生。


上一篇
鐵人賽第十九天~決策樹實作
下一篇
鐵人賽第二十一天~隨機森林實作
系列文
打造數據科學之路:資料分析與機器學習的完整指南30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言